년 5월 AI 및 로봇 연구 동향

년 5월 AI 및 로봇 연구 동향

1. 서론

2018년 5월은 인공지능 및 로봇 공학 분야에서 이론적 성숙과 산업적 확산이 폭발적으로 교차하던 변곡점으로 기록된다. 딥러닝 기술의 보편화가 일단락되고, 학계는 기존 방법론의 근본적인 한계, 즉 최적화, 표현력, 신뢰성의 문제를 깊이 파고들기 시작했다. 동시에 산업계는 인공지능을 대중적인 서비스로 전환하는 데 성공적인 이정표를 세웠다. 이 시기는 단순히 새로운 기술의 등장을 넘어, 기술의 근본을 되짚어보는 비판적 성찰이 동시에 최고 수준에서 이루어졌다는 점에서 독특한 의미를 지닌다.

본 보고서는 이 시기를 대표하는 세 가지 핵심 축을 중심으로 연구 지형도를 분석한다. 첫째, 기초 모델의 재검토와 확장이라는 주제 아래, 학습 표현과 최적화의 최전선을 다룬 ICLR 2018의 주요 연구를 살펴본다. 둘째, AI의 사회적 책임과 신뢰성 문제의 부상이라는 관점에서, 적대적 공격과 공정성의 문제를 정면으로 다룬 ICML 2018의 수상 연구를 분석한다. 셋째, 지능의 물리적 구현과 인간-로봇 상호작용의 심화라는 주제로, 로봇이 현실 세계와 상호작용하는 방식을 혁신한 ICRA 2018의 핵심 성과들을 조명한다. 마지막으로, 이러한 학문적 성과가 Google I/O와 같은 산업계의 발표를 통해 어떻게 대중적 혁신으로 이어졌는지 그 연결고리를 추적한다.

각 장에서는 주요 학회 및 산업 발표를 중심으로 핵심 연구 내용을 심층적으로 분석하고, 이들이 후속 연구와 기술 생태계에 미친 파급 효과를 조망한다. 이를 통해 2018년 5월이라는 특정 시점이 AI 역사에서 갖는 중요성을 명확히 규명하는 것을 목표로 한다.

2. 주요 학회 최우수 논문 요약

본격적인 분석에 앞서, 2018년 5월을 전후하여 열린 주요 AI 및 로봇 학회에서 최우수 논문으로 선정된 연구들을 요약하여 제시한다. 이 표는 보고서 전체의 내용을 조망하는 개요이자 각 장의 세부 내용으로 들어가는 길잡이 역할을 한다.

학회 (Conference)부문 (Category)논문 제목 (Paper Title)주요 기여 (Key Contribution)
ICLR 2018최우수 논문On the Convergence of Adam and BeyondAdam 옵티마이저의 비수렴 문제 증명 및 장기 기억(long-term memory)을 통한 해결책 제시
최우수 논문Spherical CNNs구면(S^2) 및 회전 그룹(SO(3)) 데이터에 대한 회전 등변성(rotation-equivariant) CNN 아키텍처 제안
최우수 논문Continuous Adaptation via Meta-learning…비정상(nonstationary) 및 경쟁 환경에서 소수샷(few-shot) 적응을 위한 경사 하강법 기반 메타러닝 기법
ICML 2018최우수 논문Obfuscated Gradients Give a False Sense of Security…적대적 방어 기법의 취약점인 ‘은닉 그래디언트’ 현상을 규명하고, 다수의 기존 방어 모델을 무력화
최우수 논문Delayed Impact of Fair Machine Learning정적 공정성 기준이 시간의 흐름에 따라 특정 그룹에 오히려 해를 끼칠 수 있음을 동적 모델을 통해 입증
ICRA 2018최우수 논문Compact Design of a Hydraulic Driving Robot…강한 자기장 환경인 MRI 스캐너 내부에서 정밀한 신경외과 수술을 수행할 수 있는 유압 구동 로봇 설계
HRI 최우수 논문Interactively Picking Real-World Objects…비제약적(unconstrained) 자연어 음성 명령을 이해하고 실제 객체를 조작하는 상호작용 시스템 구축
로봇 조작 최우수 논문Decentralized Adaptive Control for Collaborative Manipulation에이전트 간 통신이나 페이로드에 대한 사전 지식 없이 협동 조작이 가능한 분산형 적응 제어기 제안
의료 로봇 최우수 논문A lightweight and efficient portable soft exosuit…뇌졸중 환자의 보행 시 마비된 발목의 움직임을 보조하는 경량 고효율 소프트 엑소수트 개발

3. 학습 표현 및 최적화의 최전선: ICLR 2018 주요 연구

ICLR 2018의 최우수 논문들은 딥러닝의 핵심 구성 요소를 깊이 파고드는 연구들이었다. 이들은 단순히 기존 모델의 성능을 개선하는 것을 넘어, 최적화 알고리즘의 신뢰성, 표현 가능한 데이터의 범위, 그리고 학습 과정 자체의 효율성이라는 근본적인 질문에 답하고자 했다. 이는 딥러닝 분야가 표면적인 응용을 넘어 그 이론적, 실용적 기반을 강화하는 단계로 진입했음을 시사한다.

3.1 최적화 알고리즘의 재검토: Adam의 수렴성 분석과 대안 (“On the Convergence of Adam and Beyond”)

딥러닝 모델 학습의 표준 도구로 자리 잡은 Adam 옵티마이저의 신뢰성에 근본적인 의문을 제기한 이 연구는 학계에 큰 파장을 일으켰다. Adam은 경험적으로 뛰어난 성능을 보여주었지만, 그 이론적 수렴 보장은 명확하지 않았다. 이 논문은 Adam이 특정 조건, 심지어는 간단한 볼록 최적화(convex optimization) 문제에서도 최적해로 수렴하지 못하는 구체적인 반례를 제시하며 이 문제를 정면으로 다루었다.

연구진은 실패의 핵심 원인이 과거 그래디언트 제곱의 ‘지수 이동 평균(exponential moving average)’ 방식에 있다고 분석했다. 이 방식은 과거의 중요한 그래디언트 정보를 너무 빨리 잊어버리는 ‘단기 기억(short-term memory)’ 문제를 야기한다. 특히 드물게 발생하지만 정보량이 많은 그래디언트의 영향력이 지수 평균 과정에서 빠르게 희석되어, 학습률이 부적절하게 조정되고 결국 수렴에 실패하는 현상이 발생할 수 있음을 보였다.

이 문제를 해결하기 위해, 연구진은 과거 그래디언트 정보에 대한 ’장기 기억(long-term memory)’을 유지하는 새로운 알고리즘 ’AMSGrad’를 제안했다. AMSGrad의 핵심은 이동 평균을 계산할 때 현재까지 관찰된 그래디언트 제곱의 최대값을 유지하여, 학습률이 불안정하게 급증하는 것을 방지하는 것이다. Adam의 2차 모멘텀 추정치 v_tv_t = \beta_2 v_{t-1} + (1-\beta_2)g_t^2로 업데이트되는 반면, AMSGrad는 \hat{v}_t = \max(\hat{v}_{t-1}, v_t)를 사용하여 항상 단조롭게 증가하는(non-decreasing) 값을 보장한다. 이 간단한 수정만으로도 알고리즘의 수렴성을 이론적으로 보장할 수 있었다. 이 연구는 딥러닝 커뮤니티가 가장 신뢰하던 도구에 대한 비판적 재검토의 중요성을 일깨웠으며, 이후 AdamW, RAdam 등 다양한 Adam 변종 알고리즘과 최적화 이론 연구를 촉발하는 중요한 계기가 되었다.

3.2 표현 학습의 새로운 지평: 구면 CNN (“Spherical CNNs”)

기존의 합성곱 신경망(CNN)은 2D 평면 이미지 분석에 최적화되어 있었다. 하지만 자율주행차의 360도 카메라, 지구 기후 모델링, 분자 구조 분석 등 구(sphere, S^2) 위에서 정의되는 데이터를 처리해야 할 필요성이 점차 커지고 있었다. 구면 이미지를 평면에 투영하여 기존 CNN을 적용하는 방식은 심각한 왜곡을 유발하여, 위치에 상관없이 특징을 탐지하는 CNN의 핵심 능력인 ’이동 불변성(translation invariance)’을 훼손하는 근본적인 한계를 지녔다.

’Spherical CNNs’는 이 문제에 대한 우아한 해결책을 제시했다. 연구진은 평면에서의 ‘이동’ 개념을 3차원 회전 그룹(SO(3))에서의 ’회전’으로 일반화했다. 이를 통해 필터가 구면 위를 회전하며 특징을 추출하는 ’회전 등변성(rotation equivariance)’을 보장하는 새로운 연산, 즉 ’구면 교차-상관(spherical cross-correlation)’을 정의했다. 이는 데이터가 어떻게 회전되더라도 네트워크의 출력이 동일하게 회전하여 나타나는 특성으로, 왜곡 없이 구면 데이터를 처리할 수 있게 한다.

기술적으로 가장 큰 기여는 이 구면 교차-상관 연산을 효율적으로 계산하는 방법을 제시한 것이다. 이 연산이 일반화된 푸리에 정리(generalized Fourier theorem)를 만족함을 증명하고, 이를 통해 비가환 고속 푸리에 변환(non-commutative FFT)을 사용하여 계산 복잡도를 획기적으로 줄였다. 구면 신호 f: S^2 \to \mathbb{R}^K와 필터 \psi 간의 교차-상관은 다음과 같이 정의된다.

[\psi \star f](R) = \int_{S^2} \langle \psi(R^{-1}x), f(x) \rangle dx
이 계산은 구면 조화 함수(Spherical Harmonics)를 이용한 주파수 영역 변환을 통해 매우 효율적으로 수행될 수 있다.

연구진은 3D 모델 인식 및 분자 에너지 회귀 문제와 같은 실제 데이터셋에 제안된 모델을 적용하여 기존 방식 대비 월등한 성능을 보임으로써 이론의 실효성을 입증했다. 이 연구는 데이터의 기하학적 구조를 고려하는 ‘기하학적 딥러닝(Geometric Deep Learning)’ 분야의 초석을 다진 기념비적인 성과로 평가받는다. 이후 그래프, 메쉬 등 다양한 비유클리드(non-Euclidean) 데이터 구조에 딥러닝을 적용하는 연구 흐름에 지대한 영향을 미쳤으며, 천체 물리학, 화학, 컴퓨터 비전 등 다양한 과학 및 공학 분야로의 응용을 촉진했다.

3.3 지속적 적응을 위한 메타러닝 (“Continuous Adaptation via Meta-learning in Nonstationary and Competitive Environments”)

실제 세계의 AI 에이전트는 고정된 환경이 아닌, 규칙이나 상대방의 전략이 계속해서 변하는 비정상(nonstationary) 환경에 직면한다. 이러한 환경에서 제한된 경험(few-shot)만으로 빠르고 지속적으로 적응하는 능력은 일반 인공지능(AGI)으로 나아가는 데 있어 핵심적인 과제이다.

이 연구는 이 문제를 ‘학습하는 법을 배우는(learning-to-learn)’ 메타러닝 프레임워크로 접근했다. 특히, 모델-불가지론적 메타러닝(MAML)을 강화학습에 적용하여, 특정 환경에 대한 최적의 정책을 학습하는 것이 아니라, 환경이 변했을 때 단 몇 번의 업데이트만으로도 빠르게 적응할 수 있는 ’좋은 초기값(meta-parameter)’을 학습하는 방법을 제안했다. 에이전트는 연속적인 작업 T_iT_{i+1} 사이의 전이 관계를 학습함으로써, 미래의 변화를 예측하고 이에 대비하는 능력을 갖추게 된다.

이 접근법의 핵심은 메타-최적화 목표 함수를 통해 구현된다. 목표 함수는 T_i에서의 경험을 바탕으로 한 스텝 적응했을 때(\phi_i = \theta - \alpha \nabla_{\theta} L_{T_i}(\theta)), 다음 작업인 T_{i+1}에서 좋은 성능(L_{T_{i+1}}(\phi_i))을 내도록 초기 파라미터 \theta를 최적화하는 것이다.

\min_{\theta} \mathbb{E}_{T_i, T_{i+1}}
이러한 연속적 적응 능력을 체계적으로 평가하기 위해, 연구진은 새로운 다중 에이전트 경쟁 환경인 ’RoboSumo’와 ’반복 적응 게임(iterated adaptation games)’이라는 새로운 평가 프로토콜을 직접 설계했다. 실험 결과, 메타러닝을 통해 학습된 에이전트는 소수샷 적응 상황에서 다른 기법들을 압도하는 성능을 보였다. 이 연구는 강화학습의 적용 범위를 정적인 실험실 환경에서 동적이고 적대적인 실제 세계 문제로 확장하는 중요한 방법론을 제시했으며, 이후 다중 에이전트 강화학습(MARL) 및 지속적 학습(Continual Learning) 분야에 큰 영향을 미쳤다.

4. AI의 신뢰성과 공정성: ICML 2018 수상 연구 분석

ICML 2018의 최우수 논문들은 AI 기술의 능력 확장만큼이나 그 기술의 신뢰성과 사회적 영향을 깊이 있게 성찰해야 한다는 시대적 요구를 반영했다. 이 시기는 AI 커뮤니티가 단순히 모델을 구축하는 것을 넘어, 구축된 모델을 체계적으로 감사하고 잠재적 위험을 평가하는 방법론을 개발하기 시작한 중요한 전환점이었다. ‘은닉 그래디언트’ 연구는 보안 주장에 대한 감사를, ‘공정성의 지연된 영향’ 연구는 공정성 개입의 장기적 효과에 대한 감사를 수행하며, ’AI 감사(AI Auditing)’라는 새로운 연구 분야의 부상을 알렸다.

4.1 적대적 공격의 실체: 은닉 그래디언트의 허상 (“Obfuscated Gradients Give a False Sense of Security”)

딥러닝 모델이 인간의 눈으로는 감지할 수 없는 미세한 섭동(perturbation)에 의해 완전히 다른 예측을 내놓는 ‘적대적 예제(adversarial examples)’ 문제는 AI 시스템의 신뢰성에 심각한 위협으로 인식되고 있었다. 이에 대응하여 수많은 방어 기법들이 제안되었지만, 그 견고성에 대한 체계적인 평가는 부족한 실정이었다.

이 논문은 다수의 방어 기법들이 실제로는 모델을 근본적으로 강건하게 만드는 것이 아니라, 단지 공격자가 사용하는 그래디언트 기반 최적화 과정을 방해하는 방식으로 동작함을 폭로했다. 연구진은 이러한 현상을 ’은닉 그래디언트(Obfuscated Gradients)’라고 명명했다. 이는 방어 모델이 그래디언트 정보를 의도적으로나 비의도적으로 숨기거나(obfuscate), 왜곡시켜(shatter) 공격 알고리즘이 올바른 방향을 찾지 못하게 만드는 것을 의미한다. 이는 마치 성벽을 튼튼하게 쌓는 대신, 적의 나침반을 고장 내는 것과 같아서, 근본적인 취약점은 그대로 남아있게 된다.

연구진은 은닉 그래디언트를 유발하는 세 가지 주요 패턴(shattered gradients, stochastic gradients, vanishing/exploding gradients)을 식별하고, 각각을 효과적으로 우회할 수 있는 새로운 공격 기법들을 개발했다. 이들의 분석은 충격적인 결과를 낳았다. ICLR 2018에 발표된 9개의 백서(white-box) 보안 방어 모델 중 7개가 은닉 그래디언트에 의존하고 있었으며, 제안된 새로운 공격 기법으로 이 중 6개를 완전히, 1개를 부분적으로 무력화시켰다.

이 연구는 적대적 방어 연구 분야의 평가 기준을 재정립한 기념비적인 논문으로 평가받는다. 특정 공격에 대한 방어 성공률만으로는 충분하지 않으며, 방어 메커니즘이 더 강력하고 적응적인 공격에도 견딜 수 있는지 체계적으로 검증해야 한다는 중요한 교훈을 남겼다. 이 논문의 영향으로 이후 연구들은 ’인증된 방어(certified defenses)’와 같이 수학적으로 견고성을 보장하는, 보다 원칙적인 방향으로 나아가게 되었다.

4.2 공정성의 장기적 영향: 기계 학습의 시간 동역학적 분석 (“Delayed Impact of Fair Machine Learning”)

당시 AI 공정성 연구는 주로 특정 시점에서의 ‘정적(static)’ 분류 문제에 국한되어 있었다. 예를 들어, 대출 심사 모델이 특정 인구 집단에 불리한 결과를 내지 않도록 통계적 지표를 맞추는 데 집중했다. 그러나 이러한 접근은 모델의 결정이 시간이 지남에 따라 사회와 상호작용하며 다시 모델의 입력 데이터에 영향을 미치는 동적인 피드백 루프를 간과하는 한계가 있었다.

이 연구는 AI 공정성 논의에 ’시간’이라는 새로운 차원을 도입했다. 연구진은 모델의 결정이 사회 시스템에 미치는 장기적인 영향을 분석해야 한다고 주장했다. 예를 들어, 단기적인 공정성 기준을 만족시키기 위해 특정 그룹에 대한 대출 승인률을 인위적으로 조정하면, 해당 그룹 구성원들이 신용 기록을 개선할 기회를 박탈당하게 되어 장기적으로는 오히려 더 불리한 위치에 놓일 수 있다는 것이다.

’한 단계 피드백 모델(one-step feedback model)’이라는 간단하지만 강력한 이론적 도구를 사용하여, 연구진은 단기적인 정적 공정성 기준을 강제하는 것이 장기적으로 보호 대상 그룹의 상태를 악화시킬 수 있다는, 직관에 반하는 결과를 증명했다. 이는 공정성을 위한 제약이 개인의 노력을 통한 상태 개선 기회를 저해하는 역설적인 상황을 초래할 수 있음을 보여준다.

이 논문은 AI 공정성을 평가할 때 반드시 시간적 동역학(temporal dynamics)과 사회적 피드백 루프를 고려해야 함을 역설하며, 공정성 연구가 단순한 알고리즘 제약 문제를 넘어 사회 시스템 모델링을 포함하는 복잡한 과제임을 명확히 했다. 이는 AI 윤리 및 공정성 분야의 논의를 한 차원 높은 수준으로 끌어올린 중요한 전환점이었으며, 이후 인과추론(causal inference)과 동적 시스템 모델링을 공정성 연구에 도입하는 흐름을 주도했다.

5. 물리적 세계와의 상호작용: ICRA 2018 핵심 로봇 연구

ICRA 2018은 AI의 이론적 발전이 어떻게 로봇이라는 물리적 실체를 통해 현실 세계의 구체적인 문제를 해결하는 데 적용되는지를 명확하게 보여주었다. 인간과의 자연스러운 소통에서부터 다중 로봇의 자율적 협업, 그리고 의료 및 재활이라는 인간 중심의 응용에 이르기까지, 이 시기의 로봇 연구는 ’체화되고 적용된 지능(Intelligence Embodied and Applied)’이라는 주제를 중심으로 전개되었다.

5.1 인간-로봇 상호작용(HRI)의 발전: 자연어 기반 객체 조작

“Interactively Picking Real-World Objects with Unconstrained Spoken Language Instructions” 논문은 인간과 로봇의 소통 방식을 한 단계 발전시켰다. 이 연구의 핵심 기여는 사용자가 “파란색과 흰색 티슈 상자를 오른쪽 위 선반으로 옮겨줘“와 같이 문법적 제약이 없는 자유로운 음성 명령을 내리면, 로봇이 이를 이해하고 실제 환경에서 해당 객체를 정확히 식별하여 목표 위치로 옮기는 완전한 상호작용 시스템을 구축한 데 있다. 이는 최신 이미지 처리 기술(객체 탐지)과 자연어 처리 기술(의미 이해)을 결합하여, 추상적인 언어적 명령을 물리적 세계의 구체적인 객체 및 행동과 실시간으로 연결(grounding)하는 데 성공한 결과이다. 이 연구는 HRI가 단순 키워드 인식을 넘어, 인간의 자연스러운 소통 방식을 로봇이 이해하고 실행하는 단계로 진입했음을 보여주는 중요한 이정표가 되었다.

5.2 협동 로봇 제어의 혁신: 분산형 적응 제어

여러 로봇이 하나의 물체를 함께 운반하는 협동 조작은 확장성과 강건성 측면에서 큰 잠재력을 가지지만, 로봇 간 통신이나 조작 대상에 대한 사전 정보가 없을 경우 제어가 매우 어렵다. “Decentralized Adaptive Control for Collaborative Manipulation” 논문은 이 문제에 대한 획기적인 해결책을 제시했다. 연구진은 각 로봇이 다른 로봇과 전혀 통신하지 않고, 조작 대상 물체의 질량이나 마찰 같은 물리적 특성에 대한 사전 정보도 없이 협동 조작을 성공시키는 ’분산형 적응 제어기(decentralized adaptive controller)’를 제안했다. 리아푸노프 안정성 분석(Lyapunov stability analysis)을 통해 제어기의 안정성과 수렴성을 수학적으로 증명했으며, 각 로봇은 독립적으로 파라미터를 추정하고 제어하지만 전체 시스템은 안정적으로 목표 궤적을 추종한다. 이는 통신이 불안정한 재난 현장이나 미지의 물체를 다뤄야 하는 산업 현장에서 로봇 시스템의 실용성을 크게 높일 수 있는 길을 열었다.

5.3 의료 및 재활 로봇의 진화: 소프트 엑소수트와 수술 로봇

ICRA 2018에서는 인간의 건강과 삶의 질 향상에 직접적으로 기여하는 의료 로봇 연구가 두각을 나타냈다.

첫째, “A lightweight and efficient portable soft exosuit for paretic ankle assistance“는 뇌졸중 환자의 보행 재활을 돕는 ’소프트 엑소수트’를 개발하여 최우수 의료 로봇 논문상을 수상했다. 기존의 무겁고 딱딱한 외골격 로봇과 달리, 이 엑소수트는 옷처럼 입을 수 있는 가볍고(총 3.8kg) 유연한 재질로 만들어졌다. 허리에 장착된 소형 액추에이터가 보우덴 케이블을 통해 힘을 전달하여, 보행 주기에 맞춰 마비된 발목의 움직임을 정밀하게 보조한다. 최적화된 제어기를 통해 전력 소모를 50% 줄이면서도 일관된 보조력을 제공하여, 실제 환자들의 보행 능력을 개선하는 효과를 입증했다.

둘째, 컨퍼런스 전체 최우수 논문상을 수상한 “Compact Design of a Hydraulic Driving Robot for Intra-operative MRI-guided Bilateral Stereotactic Neurosurgery“는 의료 로봇 기술의 정밀도를 극한으로 끌어올렸다. MRI 스캐너의 강력한 자기장 환경에서는 일반적인 전자기 모터 기반 로봇을 사용할 수 없다는 난제를, MRI와 완벽하게 호환되는 소형 유압 구동 로봇 시스템을 설계하여 해결했다. 이를 통해 의사는 MRI로 뇌를 실시간 촬영하면서 동시에 로봇을 이용해 정밀한 신경외과 수술을 집도할 수 있게 되어, 수술의 정확성과 안전성을 획기적으로 향상시킬 수 있게 되었다.

5.4 자율 시스템의 통합적 설계: 자율 주행 레이싱카

최우수 학생 논문으로 선정된 “Design of an Autonomous Racecar: Perception, State Estimation and System Integration“은 고성능 자율 시스템을 구축하기 위한 통합적 접근법의 중요성을 보여주었다. 이 연구는 미지의 레이스 트랙을 인간 프로 드라이버에 버금가는 속도로 주행하기 위한 자율주행 레이싱카의 전체 시스템, 즉 인식, 상태 추정, 제어, 시스템 통합에 이르는 전 과정을 상세히 기술했다. 이는 특정 알고리즘 하나의 우수성을 넘어, 다양한 기술 요소들을 어떻게 유기적으로 결합하고 최적화해야 하는지에 대한 종합적인 청사진을 제시했다는 점에서 높은 평가를 받았다. 이 연구는 복잡하고 동적인 실제 환경에서 작동하는 강건한 자율 시스템 개발의 축소판과 같다고 할 수 있다.

6. 연구 패러다임의 전환: arXiv 주요 선행 연구

2018년 5월을 전후하여 arXiv에 공개된 선행 연구들은 당대의 연구 흐름을 넘어, 미래 연구의 방향성을 제시하는 ’사상적 리더십(thought leadership)’의 역할을 했다. 이 논문들은 당면한 문제를 해결하는 것을 넘어, 문제를 바라보는 새로운 방식을 제안하며 이후 수년간의 연구 의제를 설정했다. 이는 강화학습의 패러다임을 바꾸고, 설명 가능한 AI의 개념적 틀을 정립하며, AI의 장기적 궤적에 대한 사회적 논의를 촉발하는 형태로 나타났다.

6.1 강화학습의 새로운 비전: 월드 모델 (“World Models”)

2018년 5월 9일 최종 수정된 “World Models” 논문은 강화학습(RL) 분야에 새로운 패러다임을 제시했다. 기존의 주류였던 모델-프리(Model-Free) RL은 환경과의 수많은 시행착오를 통해 직접 정책을 학습하는 방식으로, 데이터 효율성이 매우 낮다는 근본적인 한계를 가지고 있었다.

이 연구는 에이전트가 정책을 직접 배우기 전에, 환경 자체에 대한 생성 모델, 즉 ’월드 모델(World Model)’을 먼저 학습하는 접근법을 제안했다. 이 월드 모델은 환경의 복잡한 시공간적 정보를 압축된 잠재 공간에서 학습하여 미래를 예측하는 역할을 한다. 이 구조는 세 가지 핵심 요소로 구성된다.

  1. Vision (V): 고차원의 관측(이미지)을 저차원의 잠재 벡터 z로 압축하는 VAE(Variational Autoencoder).

  2. Memory (M): 잠재 벡터 z의 시간적 순서 P(z_{t+1} \vert a_t, z_t, h_t)를 모델링하여 미래를 예측하는 MDN-RNN(Mixture Density Network-RNN).

  3. Controller (C): 월드 모델에 비해 매우 작고 단순한 선형 모델로, 압축된 정보(z_t, h_t)를 바탕으로 행동 a_t를 결정한다.

이 패러다임의 가장 혁신적인 부분은 ’꿈 속에서의 학습’이다. 일단 월드 모델(V, M)이 학습되면, 에이전트는 실제 환경과 상호작용할 필요 없이 월드 모델이 생성하는 빠르고 효율적인 ‘가상의 꿈(hallucinated dream)’ 속에서 컨트롤러(C)를 학습할 수 있다. 이렇게 학습된 정책은 다시 실제 환경으로 이전(transfer)되어 사용될 수 있다. 인식(perception)과 제어(control)를 분리하는 이 접근법은 데이터 효율성을 극적으로 향상시켰으며, 이후 ‘모델-기반 강화학습(Model-Based RL)’ 연구의 르네상스를 이끌었다. Dreamer, SimPLe 등 수많은 후속 연구들이 이 논문에서 직접적인 영감을 받았다.

6.2 설명 가능한 AI(XAI)의 부상: 해석 가능성 연구 동향

2018년 5월 30일 게시된 “Explaining Explanations: An Overview of Interpretability of Machine Learning“은 당시 막 부상하던 설명 가능한 AI(XAI) 분야에 개념적 틀을 제공한 중요한 서베이 논문이다. 딥러닝 모델이 뛰어난 성능에도 불구하고 그 결정 과정을 이해하기 어려운 ’블랙박스’라는 비판이 커지면서, 모델의 투명성과 신뢰성을 확보하기 위한 해석 가능성의 중요성이 대두되고 있었다.

이 논문은 특정 XAI 방법론을 제안하기보다, 당시 산재해 있던 다양한 해석 가능성 연구들을 체계적으로 분류하고 ’설명 가능성’에 대한 명확한 정의를 제시했다. 또한, 알고리즘적 공정성 보장, 데이터 편향 식별, 모델의 신뢰성 검증 등 다양한 측면에서 XAI가 왜 필수적인지를 역설하며 향후 연구 방향을 조망했다. 이 논문은 XAI라는 연구 분야 자체에 학문적 체계를 부여하고, 후속 연구자들이 공유할 수 있는 공통의 언어와 분류 기준을 제공했다는 점에서 큰 의미를 가진다.

6.3 AI의 미래 예측: 전문가 설문을 통한 전망 분석

2018년 5월 3일 최종 수정된 “When Will AI Exceed Human Performance? Evidence from AI Experts“는 기술적 논문은 아니지만, 당시 AI 분야의 시대정신을 엿볼 수 있는 중요한 자료이다. 이 연구는 AI 전문가들을 대상으로 설문조사를 실시하여, 다양한 과제에서 AI가 인간의 능력을 언제쯤 뛰어넘을지에 대한 집단적 전망을 제시했다.

연구 결과에 따르면, 전문가들은 언어 번역(2024년), 고등학생 수준의 에세이 작성(2026년), 트럭 운전(2027년) 등 비교적 가까운 미래에 AI가 인간을 능가할 것으로 예측했다. 더 나아가 베스트셀러 집필(2049년)이나 외과 의사 업무(2053년)와 같은 고도로 복잡하고 창의적인 영역에서도 50년 내에 인간을 넘어설 것으로 전망했다. 이러한 예측은 당시 AI 기술 발전에 대한 전문가 집단의 높은 기대감과 낙관론을 반영하며, 동시에 AI의 사회적 영향에 대한 논의를 촉발하는 중요한 계기가 되었다.

7. 산업계의 AI 혁신과 대중화: Google I/O 2018을 중심으로

학계의 이론적 성과가 산업 현장에서 어떻게 실현되는지를 가장 극적으로 보여준 사례는 2018년 5월의 Google I/O였다. 구글은 이 행사에서 AI 연구 결과를 단순한 기술 시연을 넘어, 수십억 명이 사용하는 제품과 개발자 플랫폼으로 전환시키는 전략을 명확히 보여주었다. 이는 AI가 연구 단계를 넘어 ’플랫폼화(Platformization)’되어 새로운 경제와 생태계를 창출하는 시대로 진입했음을 알리는 신호탄이었다.

7.1 대화형 AI의 도약: Google Duplex의 기술적 성취와 의미

2018년 5월 8일, Google I/O 무대에서 시연된 Google Duplex는 전 세계에 큰 충격을 주었다. AI가 사람을 대신해 미용실이나 식당에 전화를 걸어, 인간과 거의 구별할 수 없는 자연스러운 대화로 예약을 성공시키는 모습은 대화형 AI 기술의 비약적인 발전을 증명했다.

Duplex의 성공 뒤에는 여러 핵심 기술이 있었다. 첫째, 순환 신경망(RNN)을 기반으로 한 정교한 자연어 이해(NLU) 모델은 대화의 복잡한 맥락을 파악했다. 둘째, Tacotron과 WaveNet을 결합한 음성합성(TTS) 엔진은 “음…”, “아…“와 같은 인간적인 간투어(disfluencies)와 적절한 쉼(pause)을 구사하여 기계적인 느낌을 완전히 없앴다. 셋째, 상대방의 말을 끊고 들어오거나(interruption) 되묻는 등, 실제 대화에서 발생하는 복잡한 상호작용을 실시간으로 처리하는 능력을 갖추었다.

Duplex는 AI가 특정 목적을 위해 인간 수준의 대화 능력을 갖출 수 있음을 보여준 최초의 대중적 사례였다. 그러나 이 놀라운 기술 시연은 동시에 심각한 윤리적 논쟁을 촉발했다. AI가 자신을 AI라고 밝히지 않고 사람처럼 행세하는 것이 과연 윤리적인가에 대한 질문이 제기된 것이다. 이 사건은 AI 기술의 사회적 수용성과 책임 있는 개발 원칙에 대한 전 세계적인 논의를 본격화하는 중요한 계기가 되었다.

7.2 온디바이스 AI의 확산: ML Kit와 Smart Compose

구글은 최첨단 기술 시연과 더불어, AI 기술을 대중화하고 개발자 생태계를 확장하는 전략도 함께 발표했다.

ML Kit는 모바일 개발자들이 자신의 앱에 구글의 최신 머신러닝 모델을 손쉽게 통합할 수 있도록 제공하는 Firebase 기반의 SDK였다. 이미지 라벨링, 텍스트 인식, 얼굴 인식과 같은 기능들을 클라우드 연결 없이 기기 자체에서 수행하는 ’온디바이스 AI’를 구현할 수 있게 했다. 이는 AI 기술의 접근성을 획기적으로 높여, 수많은 개발자가 AI 기반의 새로운 애플리케이션을 만들 수 있는 길을 열어주었다.

Smart Compose는 Gmail에 탑재된 기능으로, 사용자가 이메일을 작성할 때 문맥을 파악하여 다음에 올 문구를 AI가 예측하고 제안해주는 기능이다. 이는 대규모 언어 모델이 어떻게 수십억 명이 사용하는 실제 생산성 도구에 자연스럽게 통합되어 일상의 편의를 높일 수 있는지를 보여준 초기 성공 사례로 평가된다.

7.3 AI 산업 생태계 동향: 투자 및 상용화 사례

2018년 5월을 전후하여 AI 및 로봇 기술의 상업화는 급물살을 타고 있었다. 2018년 5월, 페이스북 AI 연구소(Facebook AI Lab)는 AI 및 로보틱스 연구의 중심지 중 하나인 피츠버그에 새로운 연구소를 설립하며 인재 확보와 연구 개발에 대한 투자를 확대했다. Bossa Nova Robotics와 같은 로봇 스타트업은 대규모 투자를 유치하고, 월마트와 같은 대형 유통업체에 재고 관리 로봇을 수천 대 규모로 공급하는 계약을 체결하는 등 가시적인 상업적 성공을 거두기 시작했다.

이러한 움직임은 거시 경제 전망에도 반영되었다. McKinsey와 같은 주요 컨설팅 기관들은 AI가 2030년까지 세계 경제에 약 13조 달러의 추가적인 경제적 가치를 창출할 것이라는 보고서를 발표하며, AI 도입이 기업과 국가의 경쟁력을 좌우할 핵심 요소임을 강조했다. 이는 당시 산업계가 AI 기술에 걸었던 높은 기대감과 투자의 당위성을 뒷받침하는 분석이었다.

8. 종합 분석 및 2018년 이후 전망

8.1 2018년 5월의 핵심 요약: ’성능’과 ’성찰’의 교차로

2018년 5월은 AI 역사에서 중요한 변곡점으로 기록될 만하다. 이 시기는 ’World Models’와 ’Google Duplex’로 대표되는 AI 능력의 경이로운 발전을 목격한 동시에, ‘Adam의 수렴성’, ‘은닉 그래디언트’, ‘공정성의 장기적 영향’ 등 기존 방법론의 근본적인 결함과 사회적 책임에 대한 깊은 성찰이 최고 수준의 학회에서 동시에 인정받기 시작한, 이중적인 성격의 시대였다. 즉, AI 분야는 폭발적인 ’성능’의 진보를 구가하면서도, 그 기반을 되돌아보는 ’성찰’의 시간을 갖기 시작했다.

8.2 주요 연구 흐름의 통합적 분석

이 시기의 주요 연구들은 개별적인 성과를 넘어, 서로 연결되며 몇 가지 거대한 흐름을 형성했다.

첫째, 신뢰성(Trustworthiness)의 부상이다. ICML의 ’은닉 그래디언트’와 ‘공정성’ 연구, 그리고 ICLR의 ‘Adam 수렴성’ 연구는 모두 AI 시스템의 신뢰성이라는 하나의 거대 주제로 수렴한다. 이는 AI가 실험실을 넘어 현실 세계에 적용되기 시작하면서, 모델이 얼마나 정확한가뿐만 아니라 얼마나 안전하고, 공정하며, 예측 가능하게 동작하는지가 핵심적인 문제로 부상했음을 의미한다. 이 흐름은 이후 AI 연구에서 강건성(Robustness), 공정성(Fairness), 설명가능성(XAI)이 핵심 분야로 자리 잡는 데 결정적인 역할을 했다.

둘째, 일반화와 적응을 향한 길이다. ICLR의 ’Spherical CNNs’와 ‘메타러닝’ 연구, 그리고 arXiv의 ’World Models’는 모두 특정 데이터셋에 과적합된 모델을 넘어, 더 다양한 데이터 형태(비유클리드 데이터)와 동적인 환경에 적응하고 일반화할 수 있는 AI를 향한 노력이었다. 이는 좁은 영역의 전문가 AI를 넘어, 보다 유연하고 범용적인 지능을 구현하려는 시도로, 범용 인공지능(AGI)을 향한 기초 체력을 다지는 과정으로 해석할 수 있다.

셋째, 이론과 현실의 연결이다. ICRA 2018의 성과들은 이러한 이론적 진보가 어떻게 로봇이라는 물리적 매개체를 통해 현실의 복잡한 문제(의료, 협업, 소통)를 해결하는 데 직접적으로 기여하는지를 명확히 보여주었다. AI의 지능은 더 이상 시뮬레이션이나 데이터셋 안에 머무르지 않고, 물리적 세계와 상호작용하며 그 가치를 증명하기 시작했다.

8.3 2018년 이후 전망

2018년 5월에 제기된 문제들과 제시된 아이디어들은 이후 AI 연구의 주요 의제가 되었다. ‘은닉 그래디언트’ 논문 이후, 적대적 방어 연구는 더욱 엄밀하고 체계적인 평가를 중시하게 되었다. ‘공정성의 장기적 영향’ 논문은 AI 윤리 연구의 지평을 사회 시스템 동역학으로까지 넓혔다. ’World Models’와 ’메타러닝’은 강화학습의 데이터 효율성과 일반성을 높이는 핵심 아이디어로 자리 잡아, 오늘날의 대규모 로봇 학습 및 시뮬레이션 기반 학습의 이론적 토대가 되었다. 또한, ’Google Duplex’가 촉발한 사회적, 윤리적 논의는 AI 기술 개발에 있어 ‘책임감 있는 AI(Responsible AI)’ 원칙이 왜 중요한지를 전 세계에 각인시키는 계기가 되었다.

8.4 결론

결론적으로, 2018년 5월은 AI 기술이 순수한 기술적 성취를 넘어, 그 자체의 한계를 비판적으로 성찰하고 사회와 상호작용하는 복잡한 시스템으로서의 정체성을 확립하기 시작한, AI 분야의 ’성년식(coming-of-age)’과도 같은 시기였다고 평가할 수 있다. 이 시기를 기점으로 AI는 더 강력해졌을 뿐만 아니라, 더 책임감 있고 신뢰할 수 있는 기술로 나아가기 위한 중요한 첫걸음을 내디뎠다.